四川在线记者 宁宁
8月12日,记者从成都人形机器人创新中心获悉,该中心发布了最新研发成果——机器人多模态模型RRMM(Raydiculous RobotMultimodal Model)及双臂协作系统RTACS(Raydiculous Two-Arm Cooperation System),该模型能使机器人理解推理抽象的语义指令,并调度双臂协作系统执行任务。
由于此前仅有OpenAI等国外人工智能头部企业发布了类似成果,此次发布也标志着成都在我国多模态模型应用于人形机器人领域取得率先突破,进一步加速了“AI物理化”进程,也让人形机器人从“预设摆拍”、“遥控操作”进化到拥有更强的“大脑”和自主执行能力。
多模态数据协同推理,即能融合两种或两种以上不同感知来源,进行综合推理,并完成复杂任务。譬如,最新的ChatGPT4o在展示其强大功能时,测试者不用传统的键盘输入问题指令,而是在一张纸上手写一个待解方程以及手绘一个几何图形,并用语音指令要求GPT4o解题,GPT4o通过图像识别、语音识别和语义理解及推理,快速给出准确答案。
“这就是典型的多模态应用。”成都人形机器人创新中心相关负责人介绍,它主要应用于人形机器人领域,使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术。
语义指令,涉及将对象进行相对明确和相对抽象地区分和分拣,完成这些任务则需要机器人通过多模态模型自主对所有物品进行提取归纳。“比如,在对瓶子形状的物体进行可食用和不可食用区分、分拣时,需要通过进一步对瓶身包装上的文字、图片等要素进行综合判断,才能区分其为可食用还是非食用瓶装物。”成都人形机器人创新中心相关负责人说。
成都人形机器人创新中心是我国中西部地区首个人形机器人创新中心,是四川省人工智能一号创新工程的首个原点项目,致力于研发“真正拥有大脑的人形机器人整机”的人形机器人。